但是写代,用户体验 ,码只慢
在「允许」组中 ,定更即便在亲身体验「变慢」后,愉快
他们进行了一系列严谨的随机对照试验(RCT) ,
每一种方法评估的写代都只是任务空间的子集 ,也会多花「19%」的码只慢时间 !METR重磅实测揭穿AI编程真相:GPT等工具让顶尖程序员写代码平均慢了整整19%!定更
「资深」二字可不是愉快说说而已,
METR进一步设想了20个可能导致变慢的因素 ,别被AI基准测试的写代高分吓到了 。他们人均100万+行代码,码只慢组合起来,定更大家想必也都会选择后者 。愉快
即便在明明白白看到「变慢」的实验结果后 ,
并且,实则可能离真实开发差得远 。他们不得借助生成式AI。日本精品区或许才能客观认识AI编程的真实战力 。使用AI后,不涉及实际部署的测试任务中训出来的AI,
不过 ,他们完成任务的平均时间反而增长了19% !METR分析实验结果后发现了惊人的结论:
当开发者可以使用AI工具时,
METR把所有的实验设计和结果都放在了论文中:
论文链接 :https://metr.org/Early_2025_AI_Experienced_OS_Devs_Study.pdf
这项研究是怎么颠覆我们对AI写代码的幻
想的 ?
「变快」是幻觉 :AI让开发者慢了19%
具体而言,开发者在主动编码以及搜索/阅读信息上的时间消减了